什麼是「資料科學」(Data Science)?
根據 Christian Langreiter 有點酸的 twitter 留言,「所謂的資料科學家,指的是居住在加州某個地區,或是在 bitly 上班的統計學家」。言下之意,資料科學只不過是統計學的新包裝罷了。
今年六月,O'Reilly Media 的副總裁 Mike Loukides 日前發表了一本小書:what is data science? ,倒是為這個問題做了比較正式的回答。
書中從目前常見的 data-driven services 開始切入,分別從「資料哪裡來?」、「與大量的資料共舞」、「讓資料說故事」,以及「資料科學家」四個主題,來介紹資料科學。
有興趣的讀者可以參考原文,當中介紹了相當多的應用實例以及工具。簡單的來說,目前的資料科學,相較於傳統的統計學,在資料來源、分析處理方式、視覺呈現,以及從事這項工作所需具備的技能上都有些許的差別。
資料科學在文中被喻為是「未來的 Intel inside」,而能夠「獲取資料,理解資料,處理資料,從當中萃取價值,將之視覺化,並用來與人跟溝通」的能力,則會是未來十年產業急切需要的。
不知道除了文中介紹的幾個國際大廠之外,其他的科技業者準備好了嗎?
1 則留言:
Get Data Science Certification from top-ranked universities UTM, Malaysia, and IBM. We provide extensive training for the future-ready workforce.
data science training in malaysia
張貼留言